Post-mortem Coahuila 2017

Descripción

Consideramos los resultados del Conteo Rápido de las elecciones de gobernador de Coahuila 2017.

  • El diseño fue estratificado por distrito local.
  • El tamaño de muestra seleccionado fue de alrededor de 700 casillas, que equivale a una fracción de muestreo cercana al 20%.
  • A las 2:05 am del siguiente día de la elección se presenta el último reporte de COTECORA Coahuila, con 54.61% de la muestra recuperada (379 casillas), e información en los 16 estratos (distritos locales):

Los cómputos distritales para los dos candidatos punteros, sin embargo resultaron en

  • Guillermo Anaya Llamas (alianza PAN) 36.40%
  • Miguel Riquelme Solís (alianza PRI): 38.9%

La tendencia anunciada por el conteo rápido fue inversa a los resultados, y el intervalo reportado para el candidato del PRI (con error reportado de 1.2 puntos porcentuales) está a 1.6 puntos porcentuales del valor de cómputos distritales.

En este reporte buscamos explicar esta discrepancia. Dado el diseño, utilizaremos el estimador de razón combinado.

Resumen

Tiempos de llegada de casillas

Las tasas de llegada fueron en general bajas (menos de 15% de la muestra por hora en los momentos relativamente rápido), y después de las 11pm la tasa fue bajando considerablemente:

Muestra completa vs remesa

A continuación presentamos nuestras propias estimaciones, considerando la remesa de último reporte y muestra completa con cómputos distritales:

  • Para la remesa recibida, nuestros intervalos fallan de igual manera que los reportados por COTECORA Coahuila, aunque los nuestros son algo más angostos. Esto puede ser por el tipo particular de estimador que se haya utilizado.
  • La diferencia entre cómputos y datos recibidos no es causante de la discrepancia grande, aunque hay una ligera diferencia entre las estimaciones con remesa recibida y remesa usando cómputos distritales.
  • La muestra completa hubiera dado la respuesta correcta, mientras que la remesa es inconcluyente con la tendencia incorrecta.
  • El sesgo observado en la remesa con respecto a la muestra completa es aproximadamente del mismo tamaño que el error de estimación. (un poco más de un punto porcentual).

Tendencia de las estimaciones

Consideramos también cómo se ve la tendencia en el tiempo de las estimaciones:

Explicación de censura por tiempo

El sesgo no proviene de fallas en el método de estimación (es decir, sesgo por muestra chica en el estimador de razón, etc.), ni de discrepancias entre cómputos y remesas. El sesgo proviene de la influencia en la selección de la remesa por tiempo.

Los diagramas de abajo describen el escenario de muestra completa (izquierda) y un escenario donde el patrón de faltantes está influenciado por el patrón de votos observado en las casillas (derecha) lo que rompe la aleatoriedad de la muestra recibida:

  • En el caso de muestra completa, condicinando a estrato el proceso de selección (\(Z \to S\)) es independiente de votos.

  • En el caso de muestra censurada, aún condicionando a estrato, los votos están correlacionados con la muestra observada a través del tiempo de llegada (\(Votos \to Dif \to TiempoLlegada \to S\)).

  • Loes factores U que influyen en el tiempo de llegada y que no están relacionados al patrón de votos no rompen la aleatoriedad de la muestra.